查看原文
其他

模型开源不是智商税 开闭源并非二选一

阿里研究院 阿里研究院
2024-10-01

作者:傅宏宇 彭靖芷 袁媛

导语

近期有观点提出开源模型是“智商税”,意指开源模型能力不足,开源模型的使用者不够专业理智。然而,与闭源模型相比,开源模型并非能力不足,开闭源之间也并非二元对立。相反,开源反而能避免“智商税”:首先,开源模型生态让现模型专业性“梯度缓降”,推动知识的传播、技术的扩散,促进广泛的参与、经验的积累,帮助使用者提高对模型技术的认识和理解,让大家因为“懂模型”而更好地“用模型”;其次,开源提供了模型技术最佳的“试验田”,以不同规格、性能、用途的“模型池”满足应用领域和资源配置的多样化需求,并培育出了可供借鉴和选择的多元化工具链;最后,模型开源生态的建设有利于打造从模型研发到应用的、多方参与的生态秩序,为政策的选择与判断提供重要依据。针对模型开源,我们需要摒弃开源-闭源二分法,避免非此即彼的偏好或概括性地判断;需要兼容并包多样化的技术路线,将知情权和选择权留给开发者和需求方;需要鼓励更负责任的开源,与各方共同探索针对开源的治理方式。


近期有观点认为,闭源模型“最能打”,选择使用开源模型属于“智商税”,意指开源模型能力不足,开源模型的使用者不够专业理智。在能力方面,上述观点认为同样参数规模下开源模型比不上闭源模型,开源模型所针对的产品和服务和“非智商税”产品(闭源模型)相比更为次级,并不被实际需要,在激烈的市场竞争中使用开源模型可能缺乏韧性。在使用者方面,上述观点则认为使用开源模型的开发者或用户不够专业和理性,对模型的实际部署、使用等信息了解不充分,对风险的了解也不够充足,因此作出了不正确的商业判断。

 

然而,开源模型并非能力不足,开源模型与闭源模型之间并不是非此即彼的存在,这一点已成为各方的共识。此外,开源能够促使公众在多方参与的过程中更深入地认知和理解模型技术特点,增强产学研政各界之间的交流、互动、反馈、优化,为模型应用创新提供多方参与和试错迭代的空间。在这个意义上,模型开源不仅能够持续提供高性能的模型,而且能够让更多的人用模型、懂模型,通过模型开源带来的知识传播和经验积累反而有助于降低信息不对称,从而避免“智商税”。



不以开闭定优劣:开源模型并非能力不足,开闭源也并非二元对立


目前,从模型的能力发展、企业的商业策略和政府的政策选择等方面来看,“开闭源并非二元对立”已成为共识。


从模型能力发展的角度,模型的能力高低并不以开闭源为判断依据。从静态的模型能力评测来看,开源和闭源模型并未展现出性能上的悬殊,从测评结果来看开闭源模型之间在能力方面平分秋色;从动态的模型性能建设来看,开源模型与闭源模型并无显著的路径区别,都呈现阶梯型发展的特点——二者的模型训练过程均遵循“Scaling Law”,且在后续的应用过程中模型的能力并不随着使用而优化,都是通过版本迭代来实现性能上的升级。


从企业的商业策略的角度,开闭源并未作为非此即彼的单一选择,动态性和灵活性的策略选择受到欢迎。目前市面上存在专注于闭源和开源路径的企业,同时也不乏选择开闭源“两条腿走路”的大模型企业。开闭源并非单一选项,在闭源的企业中,有开源的呼声;而在开源的企业中,也有闭源的动作。企业可以选择采用开源来打造生态并充当商业化的桥梁,同时也可利用闭源为各端客户的极致场景提供精准服务。此外,目前市面上的模型也并未以“开源”和“闭源”的极端二分式进行严格划分,模型面向公众的可及性并非仅有开闭源两种状态,在这两者之间存在阶段式的可及性梯度光谱(参考《“不用旧瓶装新酒”:模型开源生态的认知——基于美国NTIA公共咨询意见的分析》),而动态、灵活地采取不同方案的组合也受到业界欢迎,如OpenAI对其GPT-2模型采用了“迭代部署”(Iterative Deployment)的方案,即首先采取开放性和广泛可及性较低的方式,再根据风险评估逐步提高开放性和可及性程度。


从各国的政策选择的角度,发挥开源的价值、鼓励和促进开源已成为国际共识。美国商务部国家电信和信息管理局在今年2月21日发布的、针对“开放式基础模型”的政策文件中,指出要“在管理和降低随之而来的风险的同时,最大限度地发挥开放式基础模型的益处”。欧盟在其《人工智能法案》中说明了开源在技术创新与创造经济价值等方面的作用,并在其基于风险等级的人工智能主体责任与监管框架中,对开源模型设置了豁免机制。英国上议院通信与数字委员会在今年2月发布的关于大语言模型与生成式人工智能的报告中指出,英国需要保证中型公司从开源和闭源技术的互补使用中获得重大最大利益,并确保监管不会遏制开源模型的提供。而我国早在2017年7月《国务院关于印发新一代人工智能发展规划的通知》中便提出开源开放的基本原则,倡导开源共享理念,促进产学研用各创新主体共创共享,并在去年10月的《全球人工智能治理倡议》提出要共享人工智能知识成果,开源人工智能技术。


开源能避免“智商税”:多方参与实现经验积累,知识传播帮助科学决策


第一,开源模型生态让模型专业性“梯度缓降”,推动知识的传播、技术的扩散,促进广泛的参与、经验的积累,能帮助使用者提高对模型技术的认识和理解,让大家因为“懂模型”而更好地“用模型”。首先,从技术本身的开放性来看,闭源模型的技术细节往往被企业或开发者团队严密保护,信息获取较不对称;而与闭源软件封闭式的技术路径不同,开源模型采取了更加透明、降低信息壁垒的方式,这使得技术内容更易于获取并接受审查,增进使用者对于模型技术的理解。其次,从技术的扩散与流动来看,开源模型以模型发布者的能力建设为中心,依照“开源方-下载部署者-服务提供商-最终用户”这一基础梯度实现技术驱动的逐级扩散,在这一过程中通过各方之间的参与、反馈、应用与互动,公众对于模型技术的认识将更加深入。最后,大模型的研发与应用相较于软件有更高的技术门槛,但模型开源的参与并不以技术贡献为指标,而以模型的广泛传播与应用普及为核心。在开源模型被学习、研究和使用的过程中,用户能够深入了解其工作原理和潜在价值,结合自身需求来实现丰富多彩的创意开发,在不断地经验积累中创造出各类特定场景的新应用,这种由内而外的技术创新模式,不仅丰富了模型的可应用场景,还促进了技术的跨界融合,加速了新技术的商业化、产业化进程。基于此,开源路径在让更多人在使用中理解模型的运作机理,促进新应用的产生和技术的进步。


第二,开源提供了模型技术最佳的“试验田”,以不同规格、性能、用途的“模型池”满足应用领域和资源配置的多样化需求,并培育出了可供借鉴和选择的多元化工具链。AI是先进的生产力,但不是只有先进的AI才是生产力,模型能力的高低并非模型应用的唯一考虑因素,在主要和普通的应用场景下,较小参数模型的表现或许也能充分满足应用的个性化需求,其他的重要考虑因素包括是否属于对数据隐私要求较高的场景(如政务管理、金融、医疗等),有没有必要进行模型本地部署和个性化定制等。而开源模型则提供了一个最佳的试错空间,在应用大规模铺开和推广之前,大家可以先行先试,以验证哪种类型的模型能在可控成本内实现目标效果。在促进模型应用的过程中,采取何种性能的模型以及方案,也需要留给需求侧结合具体情况作判断,而开源生态所打造的多样化的“模型池”则有利于满足应用领域和资源配置的多样化需求。这一多样化的开源模型池同时也提供了可供借鉴和选择的多元化工具链,帮助开发者进行多种解决方案的尝试,如端云协同对于模型尺寸的要求有差别,而开源模型池内不同规格尺寸的模型则可以为其提供尝试和验证,又如英伟达最新开源的大模型Nemotron-4的指令模型Instruct,则为合成数据的使用提供了借鉴方案。


第三,模型开源生态的建设有利于打造从模型研发到应用的、多方参与的生态秩序,并为政策的选择与判断提供重要依据。目前技术的发展存在多重的不确定性和动态性,各界对人工智能的底层逻辑和使用方式存在着“共同无知”,基于此现状,模型应用的发展方向和具体落地路径应该鼓励各方积极参与试错,应该促进不同主体在共商、共建、共享和互相竞争的过程中共同探索,并促进整体的技术知识、模型能力、产业资源的增长、积累和流动,而不是偏好某一单一特定路线并排斥其他多样化方案的提供。在这一层面上,模型开源生态的建设则提供了实现各方共同参与的最佳平台:一方面,模型是生产工具而不仅仅是提供产品及服务,而开源则提供了更接近模型本身的最佳“试验场”,让更多人用模型而不是用服务,由此更有助于模型经验知识的积累;另一方面,开源从上游研发到终端应用之间能够实现不论背景的多方主体的广泛参与,其独特的利益共享、互帮互助、相互竞争的社区文化打造了共同维护、动态探索、共识驱动的自发秩序。基于此,开源可帮助实现多层主体的参与与互动、多方意见的交汇与凝集、多重路径的探索与试错,在人工智能政策的制定亟需审慎考量、多方评判的时刻,开源这一特点对于政策的选择与判断则提供了重要参考。


摒弃二分,兼容多样,鼓励负责任的模型开源


首先,需要摒弃开闭源二分法,避免非此即彼的偏好或概括性地判断。正如OpenAI在对美国NTIA RFC中的回复所表示,作为普遍认为采取了闭源路线的大模型公司,其仍然继续支持并相信开源人工智能生态的前景。OpenAI认为开源在促进对人工智能模型内部的学术研究、帮助用户和组织进行模型本地化运行以及促进对模型的创造性修改以适应用户个性化需求方面,具有独特的优势,事实上许多AI公司也通过投资开源模型来实现品牌推广、人才招揽和开发者生态的构建,以推动公司技术的发展。最重要的是,无论是开放模型权重的发布(开源)还是基于API或者产品的发布(闭源),其都是实现有益人工智能的重要手段,最好的人工智能生态系统需要包含其两者。


其次,需要兼容并包多样化的技术路线,将知情权和选择权留给开发者和需求方。开源模型作为重要的模型发展技术路线之一,已被很多市场参与者认知、接触并使用。市场已经有了自己的选择和判断,应避免仅基于供给侧对于市场的理解,而非需求侧实际的需求,为技术的发展路线进行预设,从而限制未来的多样化发展方向。目前我们仍处于探索模型技术本身和使用的前期阶段,在这一阶段应当培育更多样化的技术底座,包容更多元化的理念思路,促进多方的往来互动以及创意的碰撞,并将知情权和选择权留给开发者和需求方。


最后,需要鼓励更负责任的开源,与各方共同探索针对开源的治理方式。与技术的发展路径同步,目前模型开源仍处于发展初期,对于如何进行开源的治理也处于探索阶段。模型在能力上的强大以及其技术上的不可预测性与难解释性,使得其与开源软件的风险管理有明显的不同,对此我们需要鼓励更负责任的开源,引导开源参与各方及开源社区共同探索具备动态性和敏捷性的治理方案。


- END -

 版块介绍 — 治理之智 


在全球化背景下,科技的快速发展也带来了前所未有的治理挑战。本板块内容依托阿里巴巴集团先进的AI科技能力、丰富的应用场景与负责任的技术生态,聚焦于AI风险、AI大模型安全、AI大模型开闭源生态、AI大模型出海等AI治理政策研究,基于技术理性的风险观,为大模型发展与安全平衡与取舍提供独到见解。同时,我们致力于收集和分享海内外AI治理先进理论与经验,为构建合理的科技治理体系提供智慧与灵感。


推荐阅读

Reading

1、治理之智 | 《大模型训练数据白皮书》在第七届数字中国峰会发布:大模型是数据要素价值释放的最短路径

2、《中华人民共和国人工智能法(学者建议稿)》:产业期待中的中国方案

3、“不用旧瓶装新酒”:模型开源生态的认知——基于美国NTIA公共咨询意见的分析

4、寻找高质量数据:对“确定性”的实践探寻和思考

5、薛澜:人工智能面临治理挑战

6、合成数据:治理之智

7、合成数据:大模型训练和应用的新方案

8、合成数据:前世今生

9、“全球AIGC版权侵权首判”留下的三个问题

10、2024年中国数据治理前瞻:再平衡与新常态

11、走向AGI时代——关于AI发展与治理的十段观察

12、段伟文|如何应对前沿科技的核心伦理风险?

13、大模型数据之二|中美大模型的竞争之路:从训练数据讲起

14、大模型训练数据之一|大模型训练的“阿喀琉斯之踵”:数据这么近那么远?

15、ChatGPT这么牛,我们应该如何兼顾发展和治理?

16、静水流深:美国人工智能治理的特征、趋势与启示

17、治理之智 | 《国际论坛》贾开、俞晗之、薛澜:人工智能全球治理新阶段的特征、赤字与改革方向

18、大模型时代:消失的飞轮

19、如何应对“模型抄袭”?对“斯坦福抄袭中国大模型”事件的三重思考


- END - 


如果对数字经济的财税金融问题有兴趣,可关注“数字经济财金沙龙”公众号


继续滑动看下一个
阿里研究院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存